ROCm и HIP: Подробное 10-главное руководство: Параллельный поворот: преобразование последовательной логики в потоки GPU

Это Параллельный поворот представляет собой фундаментальный сдвиг в вычислительной философии от временной последовательности (делать одно, а потом другое) к пространственному распределению (выполнять всё одновременно по сетке).

1. Эвристика независимости

Это золотое правило вычислений на GPU: «Когда ваша задача — «применить что-либо независимо к N элементам» — это первый способ, который следует попробовать». Этот подход к параллельной обработке данных — самый простой путь ускорения на GPU, где накладные расходы на управление потоками ничтожно малы по сравнению с огромным объёмом одновременной пропускной способности.

2. Точность и данные

Ядра HIP обычно обрабатывают массивы примитивных типов. В высокопроизводительной графике и машинном обучении мы часто используем float (одинарная точность), тогда как научные модели, требующие экстремальной числовой стабильности, используют double (двойная точность).

3. От итерации к занятости

В коде для процессора процессор «посещает» данные через циклы. В логике GPU данные «занимают» поток. Вы перестаёте писать как делать цикл и начинаете писать что должен сделать один рабочий в конкретной координате.

$$\text{Индекс } i = \text{blockIdx.x} \times \text{blockDim.x} + \text{threadIdx.x}$$

TERMINALbash — 80x24

> Ready. Click "Run" to execute.

QUESTION 1

What is the primary heuristic for deciding if a problem is suitable for the 'Parallel Pivot'?

The problem requires complex recursion.

The problem involves applying an operation independently to N elements.

The problem must be solved in a strict temporal order.

The problem uses only integer arithmetic.

QUESTION 2

In the context of the Parallel Pivot, what does the term 'Occupation' refer to?

The CPU visiting each index in a for-loop.

How many blocks are currently queued in the GPU.

Data 'occupying' a specific thread at a specific coordinate.

The percentage of memory used by the float arrays.

QUESTION 3

Which data types are most commonly handled by HIP kernels for high numerical stability in science?

bool and char

int and long

float and double

void and pointer

QUESTION 4

When pivoting a loop into a kernel, what replaces the loop counter `i`?

The return value of the function.

A global thread identity calculated from grid/block dimensions.

The hipMalloc address.

The host-side iteration variable.

QUESTION 5

Fill in the blank: To ensure production reliability even in basic kernels, you must ______.

Only use float types.

Add explicit error-checking macros everywhere.

Use a single thread per block.

Avoid all boundary checks.